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(57) Abstract 
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Phoneme sequences arc formed for the additi<mal wonls which are then 
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sowie das Vcrfahren zum Aufbau eines digitalen WOrteibuchs zur spateren 
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Dokumente ausgewahlt werden und aus 
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werden. PUr die Zusatz-Worte wciden Phonemfolgen gebiMet!^feS 
zusammen mit den Zusatz-Worten temporiir gespeichert werden 
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Beschreibvmg 

Anordnuhg zur Erstellung eines digitalen WCrterbuchs und Ver- 
fahren zum Aufbau eines digitalen WSrterbuches mit Hilf e ei- 
nes Rechners 

Ein erhebliches Problem bei der rechnergestOtzten Spracher- 
kennung besteht in der Grdfie des gespei chert en Wortschatzes . 
Da die rechnergestutzte Spracherkfennung durch Vergleich von 
Folgen von Merkmalsvektoren, die jeweils ein Wort reprSsen- 
tieren, in einem Merkmalsraum durchgefOhrt wird, wird die 
Spracherkennung mit einer Grofienanzahl zu verglei chender Wor- 
,te immer ungenauer. Die Ursache fur die steigende Ungenauig- 
keit der Spracherkennung bei steigender Anzahl zu verglei- 
chender Worte liegt in der hoheren Anzahl von Folgen von 
Merkmalsvektoren in dem Merkmalsraum. Durch die erhohte An- 
zahl von Merkmalsvektoren werden' die Abst&ide der Merkmals- 
vektoren voneinander in dem Merkmalsraum geringer und somit 
wird eine Klassif ikation des zu erkennenden Wortes ebenso im- 
mer problematischer. 

Es ergibt sich also die Nbtwehdigkeit der Reduktion des Wort- 
schatzes. Ein Problem bei der Reduktion des . Wortschatzes 
liegt jedoch darin, daB diejenigen Worte, die nicht mit den 
entsprechenden Folgen von Merkmalsvektoren gespeichert sind, 
auch nicht erkannt werden, 

Weiterhin ist ein Nachteil in einer Speicherung eines groSen 
Wortschatzes in dem erheblichen Speicherbedarf zu sehen. Die- 
ser hohe Speicherplatzbedarf fuhrt zu erheblichen Kosten, die 
bei Verwendung eines zu grofien, der Anwendung nicht angepaS- 
ten Wortschatzes nicht zu vermeiden sind. 

Der Aufbau eines Text-Phonem-Konverters ist beispielsweise 
aus den Dokumenteh fl], [2], [3] bekannt. 
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Eine Obersicht vxber Grundlagen von Expertefisystemen siiid in 
[4] beschrieben. 

Der Erfindung liegt das Problem zugrunde, eine Anordnung zur 
Ersteliung eines digitalen W6rterbuchs anzugeben, mit der ei- 
ne flexible, gunstige und qualitativ hochwertige Spracherken- 
nxmg anhand des digitalen Worterbuches realisiert werden 
kann. Bin weiteres Problem ist es eine Anordnung zur Spra- 
cherkennung anzugeben unter Verwendung des digitalen W6rter- 
buchs. Ferner liegt der Erfindung das Problem zugrunde, ein 
Verfahren zur Ersteliung eines digitalen Wdrterbuchs mit Hil- 
fe eines Rechners anzugeben, welches eine flexible, gtostige 
und qualitativ hochwertige Spracherkennung anhand des digita- 
len Wdrterbuches ermdglicht . 

Die Probleme werden durch die Anordnung gem&fi Patent anspruch 
1, der Anordnung gemSS Patentanspruch 2 sowie durch das Ver- 
fahren gemafi Patentanspruch 6 geldst. 

Die Anordnung gemafi Patentanspruch 1 weist ein Mittel zum 
Einlesen beliebiger elektronischer Dokumente, sowie einen er- 
st en Speicher zur f est en Speicherung von Standard-Wort en und 
deren Phonemf olgen und einen zweiten Speicher zur ten5>oraren 
speicherung Zusatz-Worte und deren Phonemf olgen sowie einen 
Text-Phonem-Konverter auf . Durch das Mittel zum AuswShlen und 
Einlesen beliebiger elektronischer Dokumente werden anhand 
unterschiedlichster Kriterien automatisch aus einer beliebi- 
gen Menge von elektronischen Dokumenten diejenigen Dokumente 
ausgewahlt und eingelesen, die zu einer vorgebbaren Anwen- 
) dungssituation einen passenden Wortschatz enthalten. Aus den 
Worten werden Zusatz-Worte ausgewahlt , zu deneti die entspre- 
chenden Phonemf olgen mittels des Text-Phonem-Konverters ge- 
bildet werden. Die Zusatz-Worte und die entsprechenden Pho- 
nemf olgen werden in dem zweiten . Speicher temporar gespei- 
5 chert. Mindestens die Standard-Wort e und die Zusatz-Worte und 
jeweils deren Phonemf olgen bilden das digitale Worterbuch. 
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Durch diese Anordnung ist es nuSglich, jeweils far die Dauer 
einer bestimmten charakteristischen Anwendung einen anwen- 
dungsspezifischen Wort s chat 2 zu ermitteln, und diese Worte 
zusammen mit den entsprechenden Phonemf olgen . temporar abzu- 
speichern und d em digitalen W6rterbuch temporar einzuglie- - 
dern. Wenn sich die. Anwendiing andert, werden wiederum neue 
elektronische Dokumente ermittelt und aus diesen wiederum Zvi- 
satz-worte ausgewahlt, die dann. mit. den entsprechenden Pho- 
nemfolgen in dem zweiten Speicher wiederum temporar abgespei- 
chert werden. Damit ist durch die erf indungsgemaSe Anordnung 
exne erhebliche Reduktion von Speicherplatzbedarf erreicht. . 

Die Anordnung gemafi Patentanspruch 2 weist im Vergleich zu 
der. Anordnung gemas Patentanspruch 1 zusatzlich ein Mittel 
zur sprecherunabhangigen Spracherkennung auf . Dadurch wird es 
durch die Reduktion des jeweils untersuchten (verglichenen) 
Wortschatzes bei der Spracherkennung moglieh, eine bessere 
Erkennungsleistung zu erreichen. als dies mit den bekannten 
Anordnungen m6glich ist, da die Anzahl zu vergleichender Wor- 
te verringert wurde, ohne jedoch fOr die Anwendung spezifi- 
sche, diese charakterisierende/ Worte nicht zu berQcksichti- 
gen. Ferner ist die erf indungsgemaSe Anordnung sehr flexibel 
unter verschiedensten Anwendungssituationen einsetzbar. ohne 
dais aufwendige Trainingsphasen des Wortschatzes far jede cha- 
rakteristische Anwendungs situation notig sind. Dadurch wird 
ebenso ein erheblich geringerer Bedarf an Speicherplatz er- 
reicht, was zu einer erheblichen Einsparung von Kosten far 
die Anordnung zur Spracherkennung fuhrt . 

Bei dem Verfahren gemaS Patentanspruch 6 wird ein digitales 
warterbuch mit Hilfe eines Rechners aufgebaut, welches zu Be- 
gxnn des Verfahrens schon. Standard-Worte und den Standard- 
Worten zugeordnete Phonemfolgen aufweist. Es werden in einem 
ersten Schritt elektronische Dokumente best immt, und aus deh 
elektronischen Dokumenten Zusatz-Worte ausgewahlt. Fur die 
Zusatz-Worte wird mit Hilfe des Text-Phonem-Konverters je- 
weils eine Phonemfolge gebiidet, die dem jeweiligen Zusatz- 
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Wort zugeordnet wird. Die Zusatz-Worte werden temporar ge- 
speichert und teitiporar dem digitalen W6rterbuch zugeordnet. 
Durch das erf indungsgemaSe Verfahren wird ein digitales W6r- 
terbuch in einer Weise aufgebaut, die sehr flexibel an sich 

■5 andemde Anwendungen anpassbar ist. Damit wird eine Spracher- 
kennung, die das auf die erfindungsgemafie Weise aufgebaute 
W6rterbuch verwendet, unter geringen Kosten schnell und si- 
cher durchgefuhrt, da zum einen die Anzahl fest gespeicherter 
Worte verringert wird und zram anderen die Dichte der einzel- 

10 nen Phonerof olgen in dem Merkmalsraum ebenso verringert wird, 
was zu besseren Erkennurigsleistungen in der Spracherkennung , 
fahrt. 

Vorteilhafte Weiterbildungeii der erf indungsgemaSen Anordnun- 
15 gen sowie vorteilhafte Weiterbildungen des erf indungsgemafien 
Verfahrens ergeben stch aus den abhangigen AnsprOchen. 

Fur die erfindungsgeroaSe Anordnung ist 6s in einer Weiterbil- 
dung vorteilhaft, eine Entscheidxingseinheit WE vorzusehen. 
20 durch die eine Auswahl der Zusatz-Worte aus den elektroni- 

schen Dokumenten durchgefahrt wird. Die Auswahl kann auf un- 
terschiedlichste Weise erf olgen. Damit wird durch diese Wei- 
terbilduhg eine weitere Flexibilisierung der Anwendbarkeit 
der Anordnung zur Spracherkennung erreicht . Auch wird eine 
25 weitere Reduktion des Speicherplatzbedarf s durch diese Wei- 
terbildung erreicht, da. durch eine gezielte Auswahl der Zu- 
satz-Worte aus den worten der elektronischen Dokumehte nxcht 
alle worte temporar gespeichert werden mvlssen, sondern nur 
diejenigen, die tatsachlich von gr6Serer Bedeutung bezQglich 
30 der jeweiligen Anwendungssituation sind. 

Weiterhin ist es in einer weiterbildung der Anordnung vor- 
teilhaft, einen dritten Speicher vorzusehen, in dem temporar 
Vorrats -worte und deren Phonemfolgen gespeichert werden, wo- 
. 35 bei die Phonemfolgen eine h6here Qualitat aufweisen als die 
Phonemfolgen, die von dem Text-Phonem-Konverter gebildet wer 
den. Durch diese Weiterbildung wird dife Qualitat der 
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"Phonenprototypen" erh6ht , wodurch auch die Ergebnisse . der 
Sprecherkehnung deutlich yerbessert werden. 

Ferner ist es vorteilhaft, eine Anbrdnung vorzixsehen, mit der 
'5 fur von einem Benutzer eingesprochene Worte Phohemfolgen ge- 
bildet werden und diese ebenfalls abgespeichert werden. Damit 
ist die Anwendbarkeit der Anordhving nicht mehr lediglich au£ 
elektronische Dokiaittente beschrSnkt, sondern die Anordnxing 
kann durch diese Weiterbildung auch von einem Benutzer einge- 
10 sprochene Worte verarbeiten. Dies fuhrt zu einer erhOhten 

Flexibiiitat der Anwendbarkeit der Anordnung zur Spracherken- 
nung. 

Ferner ist es fur das erfindungsgemaSe Verfahren gemafi Pa- 
15 tentanspruch 6 in einer Weiterbildung vorteilhaft, die Be^ 

stimmung, also die Auswahl der elektronischen Dokumente nach 
unterschiedlichen Vorschriften durchzufubren. 

So ist es beispielsweise vorteilhaft, die elektronischen Do- 
20 kumente eindeutig bestiinmten T^wendimgen zuzuordnen, wodurch 
die Geschwindigkeit der Durchftihrung deir Bestiinmung der elek- 
tronischen Dokximente erheblich erh6ht wird. 

Bine Verfeinerung und weitere Flexibilisierung der Auswahl 
25 der elektronischen Dokiunente wird dadurch erreicht, daE ge- 
sprochene Worte eines Benutzers von der Anordnung ziir Spra- 
cherkennung erkannt werden und die Bestiinmung anhand der er- 
kannten Worte sowie einer vorgegebenen ersten Regelbasis er- 
folgti Damit wird die eigentliche Auswahl der elektronischen 
30 Dokumente erheblich besser an die Anwendung angepasst und so- 
mit werden Zusat z -Worte ausgewahlt, die der jeweiligen Anwen- 
dung sehr gut entsprechen. 

Ferner ist es vorteilhaft, anhand der Regelbasis die Auswahl 
35 in eineiri interaktiven Dialog zwischen der Anordnung und dem 

Benutzer zu ermitteln, um somit eirie weitere Verfeinerung der 
. Auswahl zu erreichen. Auch ist eine sehr einfache Weiterbil- 
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dung des erf indungsgemaSen Verfahrens darin zu sehen, daS die 
Auswahl anhand von Dokumenttypen der eiektronischen Dokumente 
erfolgt . 

5 Ferner ist es vorteilhaft, die Auswahl der Zusatz-Worte aus 
den eiektronischen Dokum^nten in einer Weise durchzuf uhren, 
daS in bestimmter Weise markieirte. Worte automatisch als Zu- 
satz-Worte ausgewahlt werden. Damit wird die Auswahl der Zu- 
satz-Worte erheblich beschleunigt. Weiterhin ist es vorteil- 

10 haft, die Auswahl der Zusatz-Worte anhand einer vorgegebenen 
zweiten Regelbasis zu treffen. Dadurch wird die Auswahl der 
Zusatz-Wbrte erheblich verfeinert, wodurch die Anzahl teinpo- 
rar gespeicherter Zusatz-Worte reduziert wird, ohne die Zu- 
satz-Worte mit erheblicher Bedeutung bezuglich des Spracher- 

15 kennungsprozesses in der jeweiligen Anwendupg merklich zu re- 
duzieren. 

Weiterhin ist es vorteilhaft, fur die einzelnen Markierungen 
in den eiektronischen Dokumenten einen Wichtigkeitsfaktor ab- 

20 zuleiten, um daraus indirekt nur diejenigen markierten Worte 
auszuwahlen/ die tatsachlich von Bedeutung sind. Dies fuhrt 
;^u einer weiteren Reduktion des Speicherbedarf s, da eine ge- 
ringere Anzahl Zusatz-Worte gespeichert wird. Auch wird die 
Erkennungsleistung der Spracherkennurig, die das digitale W6r- 

25 terbuch verwendet, weiter erhoht, da nur eine geringere An^ 

zahl von Zusatz-Worten miteinander verglichen werden muS* So- 
mit wird die Dichte des Merkmalsraums weiter reduziert. 

Weiterhin ist es vorteilhaft, anhand der Dokumenttypen des 
30 jeweiligen eiektronischen Dokuments Markierungen zu bestim- 
men, die zur Auswahl der Zusaitz-Worte verwehdet werden. 

Die Qualitat der " Prototypen" der Phonemfolgen wird dadurch . 
erhfiht , dafi vorgegebene Vorrats-Worte mit entsprechenden Pho- 
35 nemfolgen mit berucksichtigt werden, die temporar gespeichert 
werden. Die Phonemfolgen der Vorrats-Worte weisen eine hohere 
Qualitat auf als die Phonemfolgen, die von dem Text-Phonem- 
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Konverter gebildet werden, wodurch. eine Erh6hung der spater 
unter Verwendung des digitalen W6rterbuchs durchgef ahrten 
Spracherkennung erreicht wird. 

Damit auch die BerQcksichtigung vori Worten, die von einem Be- 
nutzer eingesprochen werden, mdglich ist,. ist es in eiiier , 
Weiterbildung des Verfahreiis vorteilhaft, fUr das jeweils ge- 
sprochene Sprachsignal eine Phonemfolge zu bestimmen und die- 
se abzuspeichern. 

Bin Ausfuhrungsbei spiel ist in den Figuren dargestellt und 
wird im weiteren' ndher erlSutert . 

Es zeigen 

Fig. 1 die erfindungsgemafie Anordnuhg zur Erstellung 

eines digitalen Wdrterbuchs mit einigen Weiterbil-*. 
dungen in Form eines Blockdiagrarams ; 

Fig. 2 die erfindungsgemaSe Anordnung zur Spracher;- 

kennuiig mit einigen Weiterbildungeri in Form eines 
Blockdiagreunms ; 

Fig. 3 eine Weiterbildung der erf indungsgemdSeh 
Anordnung zur Spracherkennung mit einem 

Mit tel zum vergleichen eines eingesprochenen 
Sprachsignals mit gespeicherten Phon^- 
Merkmalsvektpren; 



Fig, 4 



eine Skizze, in der eine Weiterbildung der er- 
findungsgemaSen Anordnuhg um ein Kopfverf Olgungs- 
System dargestellt ist; 



Fig. 5 ein Ablaufdiagramm, in dem das erf indungsgemafie 
Verfahren dargestellt ist; 



Fxg. 6 ein Blockdiagramm, in dem verschiedene Alt 



erna- 
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tiven zur . Bestimmung der elektronischen Doku- 
mente dargestellt sind; 

Fig. 7 ein Blockdiagramm, in dem verschiedene Alterna- ' 
tiven zur Auswahl der Zusatz-Worte aus den elek- 
tronischen Dokumenten dargestellt sind; 

Fig. 8 ein Ablaufdiagrainm, in dem ein Verfahren zur 

Spracherkennung unter Vervendung eities digitalen 
Worterbuchs, welches auf die erf indungsgemafie 
Weise erstellt wurde, dargestellt ist. 

In Fig. 1 ist die Anordnung zur Erstellung eines digitalen 
Wdrterbuchs dargestellt. 

Die Anordnung zur Erstellung eines digitalen Wfirterbuchs uxn- 
fafit mindestens folgende Komponenten: 



- ein erstes Mittel WB zum Auswahlen uhd Einlesen elektroni- 

20 scher Dokuroente, 

- eiiien Text-Phonem-konverter TPK, 

- einen ersten Speicher SPl zur festen Speicherung von Stan- 
dard-Worten, und von Phonemfolgen. die jeweils den Standard 
Worten zugeordnet sind, sowie 

25 - einen zweiten Speicher SP2 zur temper aren Speicherung von 

Zusatz-Worten, die von dem ersten Mittel WB zum Auswahlen und 
Einlesen der elektronischen Dokurfente sowie der Phonemfolgen 
far aus den Worten der elektronischen Dokumente ausgewahlten 
Zusatz-Worte. die in dem Text-Phonem-Konverter TPK gebildet 
30 werden, gespeichert werden. 

Die Anordnung zur Spracherkennung weist dieselben Komponenten 
auf wie die Anordnung zur Erstellung eines digitalen W6rter- 
buchs. Zusatzlich ist bei der Anordnung zur Spracherkennung 
35 ein zwei^es Mittel HMM zur sprecherunabhangigen Spracherken- 
nung vorgesehen (vgl. Figur 2). 
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Die einzelnen Komponenten sind jeweils uber einen Bus BU mit- 
einander, gekoppelt. 

Die einzelnen Komponenten der Anordnungen werden im Zusammen- 
hang mit dem Verfahren n&her erldutert. 

Der Aufbau des Text-Phonem-Konverters TPK ist beispielswelse 
aus d'em Dokument [1] bekannt. 

In Fig. 3 ist eine Weiterbildung der Anordnung zur Spracher- 
kennung dargestellt, bei dem von einem Benutzer B gesprochene 
Worte in Form eines Sprachsignals SS von der Anordnving zur 
Spracherkennuiag digitalisiert werden .. In einem dritten Mittel 
MV zum Vergleichen von Phonem-Merkmalsvektoren wird far das 
jeweilige Sprachsignal SS eine Folge von Phonemen gebildet, 
die dann zusammen mit dem digitalen Sprachsignal SS in einem 
im weiteren eriauterten vierten Speicher SP4 gespeichert wer- 
den. 

fn Fig. 4 ist ein Kopfverfolgungs- System (Headtracking- 
System) mit einer Kamera K dargestellt. Die Kamera K nimmt 
eine Folge von Bilderri eines Zielobjekts, beispielsweise deri 
Kopf KO eines Benutzers B auf , und fahrt die entsprechenden 
Bildsignale der Anordnung zur Spracherkennung zu. In der An- 
ordnung zur Spracherkennung ist ferner in dieser Weiterbil- 
dung ein viertes Mittel MHT zur Kopfverf olgung vorgesehen, 
dessen Ausgestaltung im weiteren naher erl^utert wird. An 
dieser Stelle sei lediglich erlautert, dafi durch das vierte 
Mittel MHT zur Kopfverf olgung eine Auswahl der elektronischen 
Dokumente erfolgt. Dies geschieht in einer Weise, die im wei- 
teren im Zusammenhang mit dem Verfahren naher erlautert wird. 

In Fig. 5 ist in Form eines Ablaufdiagramms das erf indungsge- 
maSe Verfahren in einzelnen Verf ahrensschritten dargestellt . 
In einem ersten Schritt 501 werden aus einer Vielzahl elek- ' 
tronischer Dokumente diejenigen. elektronischen Dokumente be- 
stimmt, aus denen in einem weiteren Schritt 502 Zusatz-Worte 
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ausgewahlt werden, die far eine im weiteren erlauterten An- 
wendungssituation einen spezifischen Wortschatz enthalten. 
Dieser anwendungsspezif ische Wortschatz in Form der Zusatz- 
Worte werden dem Text-Phonexn-Konverter TPK zugefuhrt, in dem 
5 fur die Zusatz-Worte jeweils eine Phonemfolge gebildet wxrd 
503. Die Phonemfolge sowie das jeweilige Zusatz-Wort werden 
in einem zweiten Speicher SP2 abgespeichert 504 . 

Zur Best immung der elektronischen Dokuiaente 501 sind unter- 
10 schiedlichste M6glichkeiten vorgesehen. die in Fig. S.darge- 
stellt sind. Die Bestimmung kann beispielsweise auf minde- 
stens eine der folgenden Arten erfolgen: 

- Es kann beispielsweise eine eindeutige Zuordnung von elek- 
15 tronischen Dokumenten far eine bestimmte Anwendungs situation 

vorgegeben werden 601, 

- weiterhin ist es in einer Weiterbildung vorgesehen, anhand 
von worten, die von dem Benutzer B in die Anordnung zur Spra- 
cherkennung eingesprochen wurden, und von der Anordnung er- 

20 kannt wurden, sowie anhand einer vorgegebenen ersten Regelba- 
sis die Auswahl der elektronischen Dokumente zu bestxramen 

602, . 

- ferner ist es vorgesehen, anhand der erkannten Worte sowxe 
anhand der ersten Regelbasis zusaihmen mit dem Benutzer B xn , 

25 einem interaktiven Dialog zwischen der Anordnung zur Spra- 

cherkennung und dem Benutzer B die Auswahl der elektronxschen 
Dokvunente zu ermitteln 603, ^ 

- fur elektronische Dokumente, die jeweils einen vorgebbaren 
Dokumenttyp aufweisen, werden die elektronischen Dokumente 

30 anhand des Dokumenttyps ausgewahlt 604. 

Allen unterschiedlichen Varianten des Verfahrens liegt die 
erfinderische Idee zugrunde, dafi zusStzlich zu ohnehin xn dem 
ersten Speicher SPl gespeicherten Standard-Wort en und den 
35 entsprechenden Phonemfolgen far die Standard-Worte, die dort 
fest gespeichert sind. der Wortschatz eines digitalen W6rter- 
buchs anwendungsspezif isch temporar erwextert wxrd. 
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Die Anordnung zur Spracherkennung hat hierbei Zugriff auf ei- 
. ne Vielzahl unterschiedlichster elektrbnischer Doktunehte, die 
beispielsweise Text, Bildobjekte oder auch Sprache oder Vi- 
5 deos aufweisen konnen. 

Das Problem/ welches durch die Anordnung sowie das Verfahren 
gelost wird, kann anhand eines sehr einfacheri, die Allgemein- 
gultigkeit jedoch in keinster Weise einschrankenden Beispiels 
10 eriautert werden. 

Man kann sich beispielsweise die Anordnung zur Erstellung ei- 
nes digit alen W5rterbuchs oder die Anprdnung zur Spracherken- 
nung in einer Situation in einem Fahrzeug vorstellen, in der 
15 der Fahrzeug fahrer nach eirier Wegbeschreibung suchti Die An- 
ordnung zur Spracherkennung hat ublicherweise in dem erstexi 
Speicher SPl s.icherlich als* Standard-^Worte beispielsweise 
nicht Neunen kleinerer Ortschaften gespeichert. 

20 Solche Informationen wQrden den ersten Speicher SPl aberdi- 
inensional groli werden lassen. Diese Situation witrd erheblich 
verscharft, wenn man nicht nur ubliche Stadteheunen, sondem 
auch Strafiennsonen kleiner Orte, die lediglich auf sehr regio- 
nalen Stadtplanen zii f inden sind, im Rahmen der Spracherken- 

25 nung mit verarbeiten mochte* Die erf indungsgemafie Losung be- 
steht in diesem beispielhaft angefuhrten Anwendungsszenario 
darin/ daS beispielsweise elektronische Dokumente, die spezi- 
fische Informationen uber die gesuchten Orte bzw. Regionen 
aufweisen, ausgewahlt werden und dann aus diesen elektroni- 

30 schen Dokumenten die Zusatz-Worte ausgewahlt werden, die dem 
Text-Phonem-Konverter TPK zugefuhrt werden und dann zusammen 
mit den gebildeteh Phonemf olgen in dem zweiten Speicher SP2 
vorzugsweise mindestens fur die Dauer der spezifischen Anwen- 
dung gespeichert werden. Diese gespeicherten Daten werden in 

35 das digit ale W6rterbuch temporar auf genoinmen . 
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Damit wird ein sehr flexibles, anwehdungsspezif isches digita- 
les Worterbuch geschaffen, das sich auf verschiedene Situa- 
tionen und Anwendungen sehr schnell •*einstellen* kann. Ein 
weiteres Anwendungsszenario einfacher Art ist beispielsweise 
in einer Telef onauskunf t zu sehen, in der die Anordniingen 
venvendet werden. Hier konnen beispielsweise regional defi- 
nierte Telef onbucher, die jeweils unterschiedlichs.te Eigenna- 
men aufweisen, als elektronische DokxHnente ausgewahlt werden, 
land beispielsweise die Eigennamen der , entsprechenden Orte, 
die zu ciem aktuellen Zeitpunkt , also der aktuellen Anwendungr 
von Interesse sind, in den zweiten Speicher SP2 gespeichert 
werden . 

In einer Weiterbildung ist ein dritter Speicher SP3 vorgese- 
hen zur Speicherung vorgegebener Vorrat s -Wort e und den Vor- 
rats-Worten zugeordneter Phonemf olgen, die abhangig von der 
Anwendung in jeder Anwendung texnporar gespeichert werden. Die 
Phonemf olgen der Vorrats-Wprte weisen eine hohere Qualitat. 
auf als die Phonemf olgen, die von dem Text-Phonem-Konverter 
TPK gebildet werden. Wird ein Zusatz-Wort in dem zweiten 
Speicher SP2 gespeichert, so wird in dieser Ausgestaltung zu- 
erst uberpruft, ob das entsprechende Wort nicht schon als 
Vorrats-Wort in dem dritten Speicher SP3 gespeichert ist. Ist 
dies der Fall, so wird das Vorrats-Wort mi t der qualitativ 
besseren Phonemf olge in das digitale W6rterbuch auf genommen. 

Im weiteren werden Alterriativen zur Bestimmxmg der elektroni- 
schen Dokumente durch das erste Mittel WB zum Auswahlen und 
Einlesen elektronischer Dokumente beschrieben. Das erste Mit- 
tel WB zxom Auswahlen und Einlesen ist in der Weise ausgestal- 
tet, dafi die jeweils beschriebene Funktionalitat gewahrlei- 
stet ist. 

Eindeutilge Zubrdnung der elektronischen Dokuinaiit:e 601. 

Eine mogliche Weiterbildung des Verfahrens sowie der Anord- 
nung besteht darin, bestimmten Anwendungen bzw. Aktionen eine 
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beliebige Anzahl vorgegebener elektronischer Dokumente zuzu- 
ordnen, die bei Du^chf iCihrung der Aktion, bzw: bei der ent- 
sprechenden Anwendung von dem ersten Mittel WB zum Auswahlen 
und Einlesen elektronischer Dokumente ausgewahlt und eingele- 
5 sen werden . Diese eindeutigen Zuordnungen sind beispielsweise 
in einer Liste in einem Speicher der Anordnung ziar Spracher- 
kennung gespeichert • • 

Weiterhin ist es vorteilhaft, nicht lediglich feste Zuordnun- 
10 gen zu treffen, sondern fur feste Zuordnungen semantische Be- 
zuge zu schaffen und entsprechend den senvantischen Bezugen 
die elektronischen Dokumente auszuwahlen und einzulesen. Die 
semantischen Bezuge konnen aueh beispielsweise in dem Aufsu- 
chen von Synonymen von Hyper-Links bei Anklicken der- Hyper- 
15 Links von dem Benutzer B liegen. 

Auewatil der elektzrozilschen bokuxtien^e anhand erkazm^er gespro^ 
chener Worte dee Benutzers B und der erst^en R^gelbasls 602 • 

20 Bei dieser Weiterbildung des Verfahrens und der Anordnung 

werden von dem Benutzer B gesprochene Worte, die von der An- 
ordnung zur Spracherkennxing erkannt werden, zur Auswahl der 
elektronischen Dokumente verwendet . Dies geschieht dadurch, 
dafi nach Erkennen der gesprochenen Worte diese Worte in der 

25 vorgegebenen ersten Regelbasis verwendet werden,. mit der die 
elektronischen Dokumente ausgewahlt werden. 

Die erste Regelbasis ist sehr anwendungsspezif isch . Zur Ver- . 
deutlichung der Vorgehensweise sowie der Ausgestaltung des 

30 ersten Mittels WB zum Auswahlen und Einlesen elektronischer 
Dokumente wird folgendes einfaches Beispiel dargestellt. Die- 
ses einfache Beispiel soli jedoch lediglich die Grundzuge der 
ersten Regelbasis fQr eine spezifische Anwendung darstellen, 
schrankt jedoch die Allgemeingaitigkeit in keinster Weise 

3 5 ein. 
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Fur die Anwendxingssituation, die oben beschrieben wurde, bei 
der ein Fahrzeugf uhrer in einem Fahrzeug eine Navigationshil- 
fe zum Auffinden eines Zielortes benotigt ist es vorstellbar, 
da£ der Benutzer B unter anderem beispielsweise die Worte 
.5 "Landkarte", "Deutschland" , ••regional", "Muhchen'*' in die An- 
ordnung zur Spraicherkennung eingesprochen hat . piese Worte 
werden von der Anordziiing zur Spracherkennurig erkannt und der 
ersten. Regelbasis zugef iihrt . In der ersten Regelbasis sind 
zur Ermittlung der auszuwahlenden elektronischen Dokumente, 
.10 beispielsweise in diesem Fall einer regionalen Landkarte MOn- 
chens folgeride speziellen Regeln vorgegeben- 

WENN ein erkanntes Wort gleich "Landkarte" 

UND . . 

15 ein erkanntes Wort gleich "MCinchen" 

UND ' 
ein erkanntes Wort gleich " regional - 
DANN 

wahle die regionale Landkarte der Stadt Munchen aus* 

20 

In diesem Fall wird als elektronisches Dokument die regionale 
Landkarte Munchens mit dem entsprechenden Wortschatz der re- 
gionalen Ortschaf ten und beispielsweise der entsprechenden 
StraSennamen ausgewahlt und eingelesen. Aus dieserh elektroni- 
25 schen Dokument werden die Zusatz-Worte ausgewdhlt, deni Text- 
Phonem-Konverter TPK zugef uhrt, fCir die Zusatz-Woirte die Pho- 
nemfolgen gebildet und in dem zweiten Speicher SP2 abgespei- 
ch^ert. . ^ : . 

30 Ein weiteres Anwendungsszenario ist beispielsweise in einem 

digitalen personlichen Telefonbuch zu sehen, welches in einem 
ablichen Rechner mit integrierter Anordnung zur Spracherken- 
nung vorgesehen ist. Will der Benutzer B der Rechnereinheit 
beispielsweise uber den Rechner ein Fax schicken, ben6tigt 

35 der Benutzer B die Telef onnummer des Empf angers des Faxes. 
Spricht der Benutzer B beispielsweise die Worte -Fax", 
"Auskunft", "Telef onbuch" , und diese Worte werden voii der An- 
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ordnung 2ur Spracherkennung erkarmt , so sind beispielsweise 
folgende vorgegebenen Regain in der ersten Regelbasis vorge- 
sehen. 

WENN ein erkanntes Wort gleich "Fax" 
UND 

ein erkanntes Wort gleich "Telef onbuch" 
DAMN 

wahle das elektronische Dokument "pers6nliches Telef onbuch- 

aus ... 

Eine weitergehende Regel in der ersten Regelbasis zur Verfei- 
nerung dieser Vorgehensweise kdnnte beispielsweise in der 
foigenden Regel zu sehen sein: 

WENN ein erkanntes Wort gleich "En^jf anger" 
UND 

ein erkanntes Wort gleicb "Name des Exnpfangers" 
UND 

Name des En^jf Angers nicht im pers6nlichen Telefonbuch vorhan- 

den 

DANN 

wahle automat isch die Auskunft an und ermittle die gesuchte 
Telef onnummer . 

Auswabi und Einlesen der elektronischen Dokumente anband er- 
kannter Worte, der ersten Regelbasis, und elnes interaktivea 
Dialogs zwischen der Anordnung zur Spracberkennung und dem 
Benutzer B €03. 

Es ist weiterhin in einer Ausgestaltung des Verfahrens und 
der Anordnung vorgesehen, die Auswahl der elektronischen Do- 
kumente nicht lediglich auf die erkannten Worte und die erste 
Regelbasis zuruckzufuhren. sondern dieses Losungsprinzip wei- 
terzufahren und die Auswahl genauer zu tref f en in einem in- 
teraktiven Dialog zwischen der Anordnung zur Spracberkennung 
und dem Benutzer B. 



wo 97/37311 



PCT/DE97/00657 



16 



Darunter ist beispielsweise folgende Situation zu verstehen. 
Wenn der Benutzer B beispielsweise die Worte 
-Wegbeschreibung" , "Stadt", "Taufkirchen" gesprochen hat und 
5 diese worte. von der Anordnung zur Spracherkennung erkannt 
wurden, ist es in dieser Ausgestaltung vorgesehen, dalS zur 
weiteren Eingrenzung indglicher auszuw^hlender elektronischer 
Dokumente der Benutzer B beispielsweise gefragt wird, ob die 
Stadt, zu der der Benutzer B eine Wegbeschreibung benOtigt, 
10 in Deutschland liegt. Wird difese Frage bejaht, kann eine wei- 
tere, verfeinernde Frage beispielsweise darin liegen. daS die 
Anordnvirig zur Spracherkennung eine Frage an den Benutzer B 
richtet, Ob die Stadt in NorddeUtschland Oder in Sviddeutsch- 
land liegt. Diese vorgehensweise kann beliebig verfeinert 
15 werden, jeweils natvirlich anwendungsspezifisch. Entsprechend 
mussen die Regeln der erst en Regelbasis in fur den Fachmann 
bekannter Weise angepafit werden. 

Eine Obersicht uber Grundlagen von Expert ensystemen sind in. 
20 [4] beschrieben. 

Auswalxl unter Berttcksichtigung von DokuBianttypen 604 

Ih einer weiteren Ausgestaltung des Verfahrens und der AAord- 
25 nung ist es vorgesehen, zur Auswahl der elektronischen Doku- 
mente einen Dokumenttyp zu verwenden. Unt^r einem Dokumenttyp 
ist beispielsweise die Angabe. ob es sich bei dem elektroni- 
schen Dokumeht um eine reine Textdatei, uia eine Bilddatei. um 
eine Videodatei, oder eine reine Sprachdatei handelt, zu ver- 
30 .stehen. Hierbei kann beispielsweise in dem Anwendungsszenario 
eines Fahrzeugs Information uber auszuwahlende elektronxsche 
Dokumente aus enpfangenen Radiomeldungen, oder auch erkannt en 
Worten entstehen. Weiterhin sind in diesem Zusammenhang unter 
Dokumenttypen beispielsweise Angaben zu verstehen, ob es sich 
35 bei dem elektronischen Dokument um eine Landkarte. ein dxgx- 
tales Telefonbuch. ein Hotel-Reservierungs-Dokument oder, 3e 
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nach Anwendung, entsprechendes elektronisches Dokument han- 
delt. 

Die Ausgestaltung liegt darin, dafi anhand erkannter Wdrte von 
5 der Anordnung zur Spracherkennung beispielsweise erkannt 

wird, dafi es sich bei der Aiiwendung um die Suche nach einem 
Hotelziimner handeit. Die benotigteh Zusatz-Worte sollten sich 
dann sinnvollerweise auf die spezielle Anwendung einer Hotel- 
reservierung beziehen. In diesem Fall ist es vorgesehen, die- 
10 jenigen elektronischen Dokumente auszuwahlen und einzulesen, 
deren Dokumenttyp beispielsweise eine Hotelreservierung oder 
auch generell ein Hotel beschreiben. 

In, Fig. 7 sind verschiedene Moglichkeiten zur Auswahl der Zu- 
15 satz-Worte aus den ausgewahlten elektronischen Dokiamenten 502 
dargestellt. 

pie Auswahl der Zusatz-Worte aus den Worten der elektroni- 
schen Dokumente kann in einer ersten Ausgestaltung beispiels- 
20 weise aiif die Weise erfolgen, dalS auf eiiie vorgegebene Weise 
markierte Worte oder Ausdrnacke in den elektronischen Dokxjinen- 
ten automatisch als Zusatz-Worte ausgewahlt werden 701. 

Ein Beispiel einer solchen Markierung ist beispielsweise in 
25 der Hypertext -Navigationssprache HTML zu sehen, bei der bei- 
spielsweise Uberschrif ten durch entsprechende eindeutige An- 
fangs- und Endseguenzen markiert werden. Ahnliches Prinzip 
kann zur allgemeinen Markierung von Worten verwendet werden, 
Ein wei teres Beispiel einer solchen Markierung ist in der 
30 Textverarbeitungssprache LATEX zu sehen, in der einzelne Wor- 
te ebenf alls durch eindeutige Anfangs-Steuerungssequenzen und 
Schlufi-Steuerungssequenzen, markiert werden. 

In einer weiteren Ausgestaltung ist es vorgesehen, die Aus- 
35 wahl der Zusatz-Worte anhand einer zweiten Regelbasis zu 
tref f en 702 . 
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- Die Regain der zweiten Regelbasis sind wiederum sehr anwen- 
dungsspezif isch. Aus diesem Grund soil hier ebenso nur ein 
sehr grobes Prinzip moglicher Regeln der zweiten Regelbasis 
dargestellt werden. 

Es ist beispielsweise vorstellbar, daS fur einen Fall, dafi 
die Anwendung sich hauptsachlich auf GegenstSnde beziehti wo- 
mit Substantive haufige Verwendung finden werden und aus die- 
sem Grunde kann beispielsweise in dieseiri Fall eine Regel der 
10 zweiten Regelbasis darin besteheh, daS: 

WENN die Anwendung hauptsachlich gegenstandlichen Bezug hat 
DANN wahle Substantive als Zusatz^Worte aus den Worten der 
elektrbnischen Dokumente aus. 
15 ■ ■ 

Im Gegensatz dazu kann es beispielsweise in einer Anwendung, 
die sich hauptsachlich auf Tatigkeiten bezieht, sinnvoll 
sein, Verben als Z.usatz-Worte auszuwahlen. Eine mogliche Re-, 
gel. der zweiten Regelbasis hatte dann beispielsweise f olgen- 
20 den prinzipiellen Aufbau: 

WENN die Anwendung hauptsachlich Tatigkeiten beschreibt 
DANN wahle als Zusatz-Worte Verben aus den Worten der elek- 
tronischen Dokumente aus, 

25 

Eine weitere M6glichkeit kann darin bestehen, dafi man dieje- 
nigen Worte aus den elektronischen Dokumenten als Zusatz- 
Worte auswahlt, die nicht als Standard-Worte gespeichert 
sind. Eine mogliche Regel der zweiten Regelbasis hat fur die- 
30 sen Fall den folgenden prinzipiellen Aufbau: 

WENN ein Begrif f in dem. elektronischen Dokiment vorkoinmt imd 
der Begriff nicht als Standard-Wort gespeichert ist, 
DANN wahle den Begriff als Zusatz-Wort aus. 

35 

Eine Verfeinerung der Ausgestaltung der Auswahl markierter 
Worte als Zusatz-Wbrte . ist darin zu seheri, dafi fur einzelne 
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Markierungfen der Worte Wichtigkeitsf aktoreri bestimmt werden 
703, anhand derer die Auswahl der Zusatz-Worte getroffen 
wird. Beispielsweise kann bei der Ermittlung der Wichtig- 
keitsf aktoren berucksichtigt werden, daS in einer Anwendung 
5 beispielsweise die Hierarchie von Uberschriften verschiedener 
Ebenen jeweils hierarchisch in die Wichtigkeitsf aktoren mit 
einflieSen. Auch kann hierbei beispielsweise berucksichtigt 
werden, dafi "fett gedruckte" Worte wichtiger sind als "kursiv 
gedruckte" Worte, diese jedoch wichtiger sind als unmarkierte 
10 Worte. 

Eine weitere Ausgestaltung des Verfahrens und der Anordnungen 
ist in Fig. 2 dargestellt. 

15 Bei der Anordniing zur Spracherkennung ist neben dem zweiten 
Mittel HMM zur sprecherunabhangigen Spracherkennung ininde- 
stens ein vierter Speicher SP4 zur Speicherung von Phonem- 
Merkmalsyektoren, das Mittel MV ziiiu Vergleichen von Benutzer- 
Merkmalsvektoren einies Teils des digitalisierten Sprachsi- 

20 ghals SS, die den Tell des digitalisierten Sprachsignals SS 
charakterisieren, mit gespeitherten Phohem-Merkmalsvektoren 
vorgesehen. Durch die Abbildiihg von digitalisierten Sprachsi- 
gnalen^ die von einem Benutzer eingesprochen werden, auf 
schon gespeicherte Merkmalsvektoren von Phonemen ist es m6g-- 

25 lich, ausschliefilich das Losungsprinzip der sprecherunalDhan* 
gigen Spracherkennxang zu verwenden . 

Bei der Weiterbildung des Verfahrens wird das von dem Benut- 
zer B neu eingesprochene digitalisierte Sprachsignal SS in 

30 eine beliebige Anzahl von Sprachsignalteilen aufgeteilt. Dann 
wird fur eine vorgebbare Anzahl von Sprachsignalteilen je- 
weils ein Merkmalsvektor ermittelt, der dann mit den gespei- 
cherten Phonem-Merkmalsvektoren verglichen wird. Aus dem Ver- 
gleich wird jeweils; ein Ahnlichkeitswert bestimmt, der die 

35 Ahnlichkeit des jeweiligeri Sprachsignalteils mit dem jeweils 
verglichenen Phonem-Merkmalsvektor angibt. Die Ahnlichkeits- 
werte werden jeweils gespeichert und anhand der Ahhlichkeits- 
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werte wird in einem letzten Schritt eine Folge von Phonemen 
fur das digitalisierte Sprachsignal ermittelt . Durch diese 
Folge wird das digitalisierte Sprachsignal SS beschrieben und 
wird in einer Phonem-Darstellung in dem vierten Speicher SP4 
abgespeichert - Details zu dieser Weiterbildung sind in dein 
Dokument [5] zu finden. 

Durch diese Vorgehensweise wird es moglich, unter reduziertem 
Speicherplatzbedarf einen sprecherunabhangigen Algorithmus 
auf neue, eigentlich sprecherabhangige Worte anzuwenden. Die 
Vorteile dieser Weiterbildung sind v. a. in den Vorteilen der 
dadurch mCglichen Realisierung der kostengunstigen Anordnung 
zur Spracherkennung zu sehen. 

Eine weitere Ausgestaltung des Verfahrens, bei dem ein Kopf-. 
verf olgungssystem mit einer Kamera K vorgesehen ist, ist in 
Fig. 3 dargestellt- 

In einem erst en Schritt wird auf interaktive Weise zusammen 
mit dem Benutzer B bestimmt, was als eine vorgegebene Farbe 
ziom Aufbau einer Farbtabelle klassif iziert werden soil. Hier- 
zu wird durch den Benutzer in einem von einer Kamera K aufge- 
nommenen Bild ein Bildbereich markiert, der die vorgegebene 
Farbe auf weist . Dies kann vorzugsweise dadurch geschehen, daS 
z. B. bei Klassif ikation von Hautfarbe, der Benutzer B selbst 
in dem auf genommenen Bild aufgenommen wird, z. B. die Hand 
Oder Kopf des Benutzers B. Die Hand bzw. der Kopf des Benut- 
zers B auf dem Bild wird dann von dem Benutzer B ais Bildbe- 
reich markiert, der die vorgegebene Farbe aufweist. Das auf- 
genommene Bild wird in einer Anordnung gespeichert und zur 
Weiterverarbeitung zur VerfOgung gestellt . 

Hier sind auch andere Vorgehensweisen moglich, z. B. kann 
auch die Farbe eines Kleidungsstucks als vorgegebene Farbe 
angegeben werdisn, indem der Benutzer B in dem auf genommenen 
Bild z. B, einen Bildbereich markiert, der das Kleidungsstuck 
der vorgegebenen Farbe umfaSt/ 
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10 



30 



Die Markierung kaim auf verschiedene Weise erfolgen,. sie kann 
z. B. vorzugsweise durch Verwendung einer Coirputermausv der 
Tastatur. Oder alien anderen dem Fachmann bekannten Mdglich- 
keiten zur Markierung von in einer Computereinheit zu bear- 
beitenden Bildbereichen erfolgen. 

Die GroSe des markierten Bildbereichs ist von dem Benutzer 
frei wShlbar. 



Die Parbinfonhation allie'r durch die Anordnung darstellbaren 
Farben aus dem verwendeten Farbrgium, ublicherweise dem drei- 
dimensionalen R-G-B (Rot-GrOn-Blau) Raum wird durch eine 
Transformation in einen zweidimensiohalen Farbraum transform 
15 miert. Durch die Transformation geht keinerlei Farbinf brroati- 
on verloren. 

Die Transformation kann auf verschiedene Weise erfolgen. Vor- 
zugsweise sihd folgende Transformatiohsgleichungen vorgese- 
20 hen. 

Eine mdgliche Transformation besitzt folgenden Aufbau: 

(1) a = -5 

R+G + B 

25 (2) = 

R + G + B 
Hierbei bezeichnen 

- R den Anteil der Farbe Rot an der jeweiligen Farbe, 

- G den Anteil der Farbe Grun an der jeweiligen Farbe, 

- B den Anteil der Farbe Blau an der jeweiligen Farbe, 

- a eine erste . Raumkoordinate in dem zwei dimensional en Farb- 
raum, und 

- b eine zweite Raumkoordinate in dem zwei dimensional en Farb- 
raum. 



35 
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Weitere Trans forma tionen sind dem Fachmann bekannt und koimen 
ohne Einschrankung in dem Verf ahren eingesetzt werden. . 

Durch die Transformation wird jedem Punkt in dem dreidimen- 
5 sionalen Farbraum eindeutig ein Punkt in dem zweidimen si ona- 
len Farbraum zugeordnet . 

FOr den im Vorherigen beschriebehen durch den Benutzer inar- 
kierten Bildbereich wird ein erster Farbmittelwert berechnet. 
10 der einen Durchschnittswert aller in dem markierten Bildbe- 
reich vorkomtnenden Farben reprasentiert . Da eine Farbe in ei- 
ner Computereinheit durch einen Zahlenwert reprasentiert 
wird, kann die Berechnung z. B. durch Bildung einer Summe 
aber alle Farbwerte jedes in dem markierten Bildbereich sich 

15 befindenden Bildpunktes und anschlieSende Division durch die 
Anzahl der in dem markierten Bildbereich sich befindenden 
Bildpunkte erfolgen. Das Ergebnis ist dann der den ersten 
Farbmittelwert reprasentierender Zahlenwert. Der erste Farb- 
inittelwert wird ebenso durch einen Punkt im zweidimensionalen 

20 Farbraum reprasentiert. 

Nun wird auf dieselbe, oben beschriebene Weise in dem mar- 
kierten Bildbereich ein zweiter Farbmittelwert berechnet wo - 
bei ein Anteil von n% der in dem markierten Bildbereich sich 

25 befindenden Bildpunkte unberCicksichtigt bleibt bei der Be- 
rechnung des zweiten Farbmittelwerts . Der Anteil von n% der 
uhberacksichtigten Bildpunkte sind die Bildpunkte, die in dem 
zweidimensionalen Farbraum am weitesten von dem ersten Farb- 
mittelwert entfemt sind, also jew6ils eine Farbe aufweisen, 

30 die sich von dem ersten Farbmittelwert am meisten unterschex- 
det. 

Diese NichtberOcksichtigung von Farbwerten dient zur Fehler- 
kompensation. Dieses Vorgehen ist sehr vorteilhaft, urn z. B. 
35 bei der Berechnung von einem die Hautf arbe reprasentierenden 
' zweiten Farbmittelwerts anhand eines markierten Bildbereichs , 
der durch den Kopf des Benutzers dargestellt wird, Farbunre- 
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gelmaSigkeiten, wie z.. B. die Augeh des Benutzers, die sich 
auch in dem markierten Bildbereich befinden, auszugleichen. 

Die Gr6fie von n. also die Angabe. wieviei % der sich in dem 
markierten Bildbereich befindenden Farbwerte unberQcksichtigt 
bleiben sollen. ist abhdngig sowohl von dem Objekt, anhand 
dessen der zweite Farbmittelwert gebildet werden soil als 
auc^ von der benotigten Genauigkeit des zweiten Farbmittel- 
wert s und der zur Verfagung stehenden Rechenleistung. Aus 
diesem Grund muS die GrCEe n jeweils an die entsprechende Si- 
tuation angepaSt werden. Die GroSe vonn kann vorzugsweise in 
einem Bereich von 5 - 50 liegen. Das Verfahren ist nicht be- 
s.chrankt auf deh zweiten Farbmittelwert . Mit derselben Vorge- 
hensweise kCrmen mehrere Farbmittelwerte, unter Verwendung 
von.xinterschiedlichen werten fUr n, gebildet werden. Eine ha- 
bere Anzahl von Farbmittelwerten erhOht die Qualitat der spa- 
ter folgenden klassif ikation. Ohne EinschrSnkung der Allge- 
meingultigkeit wird im folgenden nur der zweite Farbmittel- 
wert betrachtet . 

AnschlieSend wird eine beiiebige Anzahl von Negativf arbwerten 
ausgewahlt . Unter Negativf arbwerten sind in diesem Zusammen- 
hang Farbwerte zu verstehen, die nicht der vorgegebenen Farbe 
entsprechen. Vorzugsweise wird mindestens ein die Farbe Weifi 
reprasentierender WeiEpunkt in dem zwei dimensional en Raum als 
exn Negativfarbwert verwendet. Eine erh6hte Anzahl von Nega- 
tivf arbwerten verbessert die im we iter en beschriebene Klassi- 
fxkation aller Farben in eine Farbe, die als der vorgegebenen 
Farbe zugehorig, d. h. als genugend ahnlich, und in eine der 
vorgegebenen Farbe' nicht ahnlichen Farbe. 

Sowohl um den zweiten Farbmittelwert als auch urn jeden den 
Deweiligen Negativfarbwert represent ierenden Negativf arb- 
punkt, z. B. um den Weifipunkt, wird eine runde, z. B. kreis- 
fSrmige oder elliptische Region gebildet. Diese Regionen wer- 
den im folgenden als eine Mittelwertregion fur den zweiten 
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Farbmitteiwert und als Negativf arbregionen fur die Regionen 
um die Negativfarbpunkte bezeichnet. 

Die Regionen konnen beliebige Gr6Se aufweisen, es ist also 
5 auch moglich, daS sich Regionen uberlappen oder eine Region 
vollstandig eine andere Region umschlieSt, 

FQr jeden von der Computer einheit darstellbaren, in .den zwei- 
diiaensionalen Farbraum transf or^iierten Farbwert> der durch 

LO den jeweiligen Farbpunkt reprSsentiert wird, wird exne Klas- 
sifikation durchgefiihrt. ob der jeweilige Farbpunkt als dem 
vorgegebenen Farbpunkt, der den zweiten Farbmittelwert repra- 
sentiert genugend ahnlich eingeordnet wird oder ob der jewei- 
lige Farbpunkt als dem vorgegebenen Farbpunkt nicht ahnlxch 

15 klassif iziert wird. • 

t)ie Klassif ikation wird in der Weise durchgef ahrt , daS fVir 
jeden von der Computereinheit darstellbaren Farbpunkt em Lot 
gefallt wird auf jede Verbindungsgerade des den zweiten Farb- 

•20 mittelwert reprasentierenden vorgegebenen Farbpunkts mxt oe- 
dem Negativf arbpunkt . Dadutch entstehen genau so vxele Lot- 
fuSpunkte, darunter ist der Schnittpunkt des jeweiligen Lots 

. mit der entsprechenden Verbindungsgerade zu verstehen, wxe 
Negativfarbpunkte. 

Fur jeden LotfuBpunkt wird ein erster Abstand berechnet von 
dem Lotfufipunkt zu dem den zweiten Farbmittelwert reprasen- 
tierenden vorgegebenen Farbpunkt. Der erste Abstand wird mxt 
einem zweiten Abstand verglichen. der den Abstand des ent- 
30 . . sprechenden Lotfufipunktes zu dem jeweiligen Negativf arbpunkt 
darstellt . 

Ein Farbpunkt wird dann als dein zweiten Farbmittelwert repra- 
sentierenden vorgegebenen Farbpunkt genugend ahnlich klassx- 
35 fiziert. wenn far jeden Lotfufipunkt des Farbpunkts der erste 
Abstand geringer ist als der zweite Abstand und jeder LotfuS- 
punkt in der Mittelwertregion liegt. 
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Das binare Ergebnis wird in der Farbtabelle gespeichert, die 
nach AbschluE des oben beschriebenen Verfahrehs far jeden 
Farbpunkt in dem zwei dimensional en Farbraum, also fur jedie 
von der Computereinheit darstellbaren Farbe einen binaren 
Eintrag enthait. 

Die Farbtabelle enthait fur jeden Farbwert, der jeweil.s einen 
Eintrag in der Farbtabelle eindeutig adressiert. die binare 
Information, ob der Farbpunkt als der vorgegebenen Farbe dhn- 
lich klassif iziert wurde oder nicht . 

Der Aufbau der Farbtabelle nach dem oben beschriebenen Ver- 
fahren ermSglicht eine Echtzeitrealisierung verschiedeher 
Verwendungen der Farbtabelle, da fur einen Farbwert nur ein 
binarer Wert ausgelesen werden ihuS, damit bekannt ist, ob der 
Farbwert als der vorgegebenen Farbe genxigend ahnlich klassi- 
f iziert wurde. 

Nachdem die Farbtabelle gebildet wurde, wird far das gesamte 
von der Kamera K auf genommene Bild ein beliebiger bekannter 
Algorithinus . zur Kantenverfolgung durchgef Qhrt . Hit Hilfe die- 
ses Verfahrehs warden in dem Bild Dbjekte und deren Objekt- 
kanten ermittelt, deren Farbe z. B. laut der Farbtabelle als 
der vorgegebenen Farbe ahnlich klassif iziert warden. 

Nachdem das Verfahren auf das Bild angewendet wurde, befindet 
sich mdglicherweise eine Vielzahl von Objekten auf dem Bild, 
die als das Zielobjekt in Frage kpiranen. 

Aus dieser Vielzahl von Objekten wird nun das Zielobjekt er- 
mittelt anhand bekannter Kennzeichen des Zielobjekts. Die 
Kennzeichen konnen z. B. durch die Grofie des Zielobjekts oder 
die Form des Zielobjekts represent iert werden. 
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Abhangig von der vofgesehenen Verwendung des Verfahrens kann 
z. B- noch das geometrische Moment des Zielobjekts berechnet 
werden . . 

AnschlieBend wird far das Zielobjekt ein das Zielobjekf um- 
schreibendes Rechteck ermittelt . Alle Objekte. die die vorge- 
gebene Farbe aufweisen und die sich aufierhalb des uinscbrei- 
benden Rechtecks befinden. werden als dem Hintergrundbild zu- 
geh6rig eingeordnet. 



10 



Das verfahren kann verbessert werden^ indem zu Beginn des 
verfahrens von der Kamera ein Hintergrundbild aufgenommen 
wird, das dieselbe Szene aufniromt, wie spater, wenn das Ziel- 
objekt in der Szene vorhariden ist . Bei dem Hintergrundbild 
15 ist das Zielobjekt nicht vorhanden. 

Das verfahren wird in diesem Fall auf die Weise verbessert . 
daS bei der Klassif ikation eines Objekts zu dem Zielobjekt 
das Objekt nur dann als das Zielobjekt klassif iziert wird, 
20 wenn sich das Objekt auSerdem nicht auf dem Hintergrundbild 
bef indet . 

wenn das Zielobjekt durch einen Kopf reprasentiert wird. ist 
das Ergebnis des Verfahrens z. B . die Position des Kopf es in- 
25 nerhalb des Bildes. 

Wenn das Zielobjekt durch eine Hand reprasentiert wird, ist. 
das Ergebnis des Verfahrens z, B. die Position der Hand in- 
nerhalb des Bildes, die Entfernung der Hand zur. Kamera, dxe 
30 das Bild aufnimmt, Oder die Position der einzelnen Finger der 
Hand die z. B. bestimmte Handgesten reprasentieren. 

Durch die weiterverarbeitung nur des umschreibenden Recht- 
ecks, fur das im weiteren z. B. eine Bewegungsschatzung 
35 durchgefahrt wird, um die Position des umschreibenden Recht- 
ecks und damit des Zielobjekts in einem f olgenden Bxld zu er- 
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mitteln, wird der benofcigte Rechenbedarf erheblich reduziert 
gegenuber bekannten Verfahren. 

Details aber ein Kopfverf olgungssystem sind beispielsweise in 
dem Dokument [6] zu finden. 

Ergebnis des oben beschriebenen Verfahrens ist ein erkannteg 
Zielobjekt. Anhand des Zielobjekts , . beispielsweise anhand von 
Gesten der Hand oder einer Blickrichtung des Kopfes KO des 
Benutzers B kann die Bestimmung der elektronischen Dokuinente, 
abhangig von der jeweiligen serfiantischen Interpretation der 
Zielobjekte, erfolgen. 

In Fig. 8 ist in Form eines Ablauf diagramms ein Verfahren zur 
Sptacherkennung unter Verwendung eines digitalen W6rterbuchs, 
welches durch das Verfahren aiifgebaut wurde, dargestellt. 

Bei diesem Verfahren wird ein von d^ Benutzer B gesprochenes 
Wort aufgenoinmen 801, das Wort abgetastet, also digitalisiert 
802, und das Wort in eine beliebige Anzahl von Sprachsi- 
gnalteilen aufgeteilt 803. 

FQr die einzelnen Sprachsignalteile werden Merkmalsvektoren 
gebildet 804, beispielsweise mittels Four iertrans formation. 
Unter Verwendung eines Verfahrens zur Abstandsberechnung zwi- 
schen den gebildeten Merkmalsvektoren und gespeicherten Merk- 
malsvektoren der Phonemfolgen Oder auch einzelnen Segmenten 
der Phoneme werden Wahrscheinlichkeitenermittelt, durch die 
angegeben wird, wie wahrscheinlich die jeweilige Folge der 
Merkmalsvektoren fur dieses Phonem ist 805. AnschlielSend wird 
in dem digitalen Worterbuch das Wort, reprasentiert durch die 
Phonemfolge, beispielsweise nach dem sogenannten Viterbi- 
Verf ahren oder aUch dem Verfahren der dynamischen Programmie- 
rung das Wort in dem digitalen Worterbuch gesucht . 

In binem letzten Schritt 806 wird das erkannte Wort in einer 
Ausgabeeinheit dem Benutzer B zur Kenntnis gebracht . Die Aus- 
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gabeeinheit kann beispielsweise ein Bildschirm. ein Lautspre- 
Cher, Oder auch ein Drucker sein. 



:) 
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In diesem Dokument wurden folgende Ver6f f entlichungen zi- 
tiert: 

[1] K. Wothke, Morphologically Based Automatic Phonetic 
Transcription, IBM Systems Journal , Vol . 32, No. 3, 
S. 486 - 511, 1993 

[2] s. Besling, Heuristical and Statistical Methods for ' 
Grapheme-to-Phoneme Conversion, Proceediiigs KONVENS 
1994, Vienna, Austria, S. 23 - 31, 1994 

(31 W. Daelemans et al. Data-oriented Methods for Grapheme- 
to-Phoneme Conversion, Proceedings EACL 1993, Utrecht, 
S. 45 - 53, 1993 

(4] K. Bauer et al, Expertensysteme: Einfuhrung in Technik 
und Anwendung, SIEMENS AG, Engineering & Kommunikation, 
D. Nebendahl (Hrsg. ), Siemens -Aktiengesellschaft 
(Abteilung Verlag) , ISBN 3-8009-1495-6, S. 27 - 82, 1987 

t5J L. De Vos, Rechnereinheit zur Spracherkeainung und 
Verfahreh zur rechnergestQtzten Abbildung eines 
digitalisierten Sprachsignals auf Phoneme, Amtliches 
Aktenzeichen P 19610848:9 

16] C. Maggioni, Verfahren zxun Aufba.u einer Farbtabelle in 

einer Computereinheit zur Klassif ikation von Bildpunkten 
in einem Bild, Amtliches Aktenzeichen P 19516664.7 
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Patentanspruche 
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1 Anordnung zur Erstellung eines digitalen W6rterbuchs. 

- mit einem ersten Speicher (SPl). zur fasten Speicherung von 
Standard-worcen und den standard-Worten zugeordneter Phonem- 

- mit einem ersten Mittel (WB) zum Auswahlen und Exnlesen be- 
liebiger elektronischer Dokumente. zu denen die Anordnung Zu- 

griff hat. ^^v. 

- mit einem Text-Phonem-Konverter (TPK) zur Bildung von Pho- 
nemfolgen fur Zu.satz-Worte, die aus den elektronischen Doku- 
menten ausg^wahlt werden. der mit dem ersten Mittel (WB) und 
einem zweiten Speicher gekoppelt ist, und 

- mit dem zweiten Speicher (SP2) zur temporaren Speicherung 
der zusatz^worte und der von dem Text-Phonem-Konverter (TPK) 
gebildeten Phonemfolgen der Zusatz-Worte, wobei mxndestens 
die Standard-Worte. die Zusatz-Worte und die Phonemfolgen xn 
dem digitalen Wdrterbuch enthalten sind. 

2 Anordnung zur Spracherkehnung, 

-'mit einem ersten Speicher (SPl) zur festen Speicherung von 
Standard-Worten und den standard-Worten • zugeordneter Phonem- 

folgen, . , * ,| 

- mit einem ersten Mittel (WB) zum Auswahlen und Exnlesen be- 
liebiger elektronischer Dokumente. zu denen die Anordnung Zu- 

!"llt etlem Text- Phonem- KOnverter (TPK) zur Bildung von Pho- 
nemfolgen far Zusatz-Worte, die aus den -^-^^^^^^f ^^L^^^;;: 
menten ausgewahlt werden. der mit dem. ersten Mxtt.l (WB) und 

einem zweiten. Speicher gekoppelt ist, 

- mit. dem. zweiten Speicher (SP2) zur ten^oraren Spexcherung 
der Zusatz-Worte und der von dem Text-Phonem-Konverter (TPK) 
gebildeten Phonemfolgen der Zusatz-worte, wobei mindestens 
die Standard-Worte. die Zusatz-Worte und die Phonemfolgen xn 
dem digitalen Wdrterbuch enthalten sind, und 
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- mit einem zweiten Mittel.(HMM) zur sprecherunabhSngigen 
Spracherkennung welches zur Spracherkennung den Inhalt des 
digitalen W6rterbuchis verwendet . 

5 3. Anordnung nach Anspruch 1 oder 2, 

bei der zusatzlich eine Entscheidungseinheit (WE) vorgesehen 
ist zur Auswahi der Zusatz-Worte aus den elektrohischen Doku- 
menten, die von dem zweiten Mittel (WB) bestimmt wurden. 

10 4 . Anordnung nach eineiu der Anspruche 1 bis 3, 

bei der ein dritter Speicher (SP3) vorgesehen ist zur Spei- 
cheruag , vorgegebener Vorrats--Worte und den Vorrats-Worten zu- 
geordneter Phonemf olgen, die abhangig von der Anwendung in 
jeder Anwendung temporar gespeichert werden, wobei die Pho- 

15 nemfolgen der Vorrats-Worte eine hShere Qualitat aufweisen 

als die Phonemf olgen, die von dem Text-Phonem-Konverter (TPK) 
gebildet werden. 

5. Anordnung nach Anspruch 4, 

20 bei der die Anzahl der Vorrats-Worte gr6Ser ist als die An- 
zahl der Standard-Worte . 

6. Anordnung nach einem der Anspruche 1 bis 5/ 

mit einem vieirten Speicher (SP4) zur Speicherung von 
25 Sprach-Merkmalsvektoren von Wort en und/ oder Worte, die von 
einem Benutzer vorgegeben werden, wobei die Sprach- 
Merkmalsvektoren jeweils einen Teil des Wortes charakterisle- 
ren, und 

• mit einem Mittel zum Vergleichen von Benutzer- 
30 Merkmalsvektoren eines Teils eines digitalisierten Sprachsi- 
gnals, die den Teil des digitalisierten Sprachsignals charak- 
t6risieiren, mit gespeicherten Phonem-Merkmalsvektoren 
und/oder mit gespeicherten Sprach-Merkmalsvektoren, wobei die 
Phonem-Merkmalsvektoren jeweils das Phonem charakterisieren 
35 und wobei die Sprach-Merkmalsvektoren jeweils einen Teil des 
Wortes charakterisieren. 
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7. Verfahrfen zum Aufbau eines digitalen WSrterbuchs, welches 
Standard-Worte und den Standard-Wort en zugeordnete . Phonemfol- 
gen aufweist, die in einem ersten Speicher (SPl) fest gespei- 
chert werden, mit Hilfe eines Rechners, 

- bei dem elektronische Dokuiiiente best immt werden, die Worte 
aufweisen, 

- bei dem aus den elektronischen Dokumenten Zusatz-Worte aus- 
gewShlt werden, 

- bei dem mit einem Text - Phonem-Konverter (TPK) zu jedem 2u- 
satz-wort eine das Zusatz-Wort charakterisierende Phonemfolge 
gebildet wird, die dem jeweiligen Ziisatz-Wort zugebrdnet 
wird, 

- bei dem die Zusatz-Worte und die den Zusatz-Worten zugeord- 
neten Phonemfolgen temporar in einem zweiten. Speicher (SP2) 

15 gespeichert werden und temporar dem digitalen Worterbuch zu- 
geordnet werden. 

8. Verfahren nach Anspruch 7, 

bei dem die Bestimmung der elektronischen Dokumente nach min- 
destens eiher der folgenden vorschriften erfolgt: 

- es ist eine eindeutige Zuordnung der elektronischen Doku- 
mente vorgegeben, 

- es werden gesprochene Worte eines Benutzers von der Anbrd- 
nung zur Spracherkennung erkannt und die Bestimmung erfolgt 
anhand der erkannten Worte und anhand einer vorgegebenen er- 
sten Regelbasis, 

- es werden gesprochene Worte eines Benutzers yon der Anord- 
nung zur Spracherkennung erkannt und die Bestimmung erfolgt 
anhand der erkannten Worte und anhand eiher vorgegebenen er- 
sten Regelbasis in einem interaktiven Dialog zwischen der An- 
ordnung zur Spracherkennung und d&m Benutzer, 

- fur jeden Dokumenttyp der elektronischen Dokumente werden 
den Dokumenttyp charakterisierende Inf orrriationen gespeichert, 
anhand der die elektronischen Dokumente bestimmt werden. 



20 
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9 . Verfahren nach Anspruch 7 oder 8 , 
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bei, dem die Auswahl der Zusatz-Worte aus den eleJctronischen 
Dokumenten nach mindestens einer der folgeiiden Vorgehenswei- 
sen erfolgt: 

- BS werden diejehigen Worte aus den elektronischen Dokuinen- 
5 ten als Zusatz-Worte ausgewahlt, die in den. elektronischen. 

Dokumenten in mindestens einer vorgebbaren Weise markiert 
sind, 

- die Auswahl erfolgt ailharid einer yorgegebenen zweiten Re- 
gelbasis, 

10 - es werden die jenigen Worte aus den elektronischen Dokumen- 
ten als Zusatz-Worte ausgewahlt, die in den elektronischen 
Dokumenten in mindestens einer vorgebbaren Weise markiert 
sind und die einen Wichtigkeitsf aktor aufweisen, der aus der 
Markierung abgeleitet wird, der groSer ist als eine vorgebba 

15 re.Anzahl Wichtigkeitsf aktoren anderer Worte, 

- es werden die jenigen Worte aus den elektronischen Dokumen- 
ten als Zusatz-Worte ausgewahlt, die in den elektronischen 
Dokumenten in mindestens einer vorgebbaren Weise markiert 
sind, wobei aus einer Angabe eines Dokumenttyps des jeweili- 

20 gen elektronischen Dokuments die Markierungen ermitteit wer- 
den, die zur Auswahl der Zusatz-Worte verwendeit werden. 

10. Verfahren hach einem der Anspruche 7 bis 9, 

bei dem vorgegebene Vorrats-Worte und den Vorrats-Worten zu- 
25 geordnete Phonemfolgen abhahgig voh der Anwendung in jeder 

Anwendung temporSr gespeichert werden und dem Worterbuch zu- 
geordnet werden, wobei die Phonemfolgen der Vorrats-Worte ei 
ne hohere Qualitat aufweisen als die Phonemfolgen, die. von 
dem Text-Phonem-Konverter (TPK) gebildet werden. 

30 

11. Verfahren nach einem der Anspruche 7 bis 10, 

- bei dem ein von einem Benutzer gesprochenes, digitalisier- 
tes Sprachsignal in eine beliebige Anzahl von digitalen 
Sprachsignalteilen aufgeteilt wird, 

. 35 - bei dem fur eine vorgebbare Anzahl der Sprachsignal teile 
far jeden Sprachsignalteil folgende Schritte durchgefuhrt 
werden: 
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. — fur den Sprachsigrialteil wird ein Benutzer-MerkiaalsveKtor 
ermittelt, der den Sprachsignalteil charakterisiert ; 

- aus einem Vergleich des Benutzer-^Merkmalsvektors mit min- 
destens einer beliebigen Anzahl von . Phonem-Merkmalsvektoren, 

5 die jeweils ein gespeichertes Phonem charakterisieren, wird 
jeweils ein Ahnlichkeitswert des Benutzer-Merkmalsvektors mit 
dem jeweiligen Phonein-Merkinalsvektor enhittelt, 
die Alinlichkeitswerte werden gespeichert, 

- anhand der Ahhlichkeitswerte wird eine Folge von Phonemen 
10 far das digitalisierte Sprachsignal ermittelt;, durch die das 

digitalisierte Sprachsignal beschrieben wird^ und 

- bei dem das digitalisierte Sprachsignal und die dem digita- 
lisierten Sprachsignal zugeordnete Folge von Phonemen in ei- 
iiem yierten Speicher {SP4) gespeichert wird- 

15 . 

12. Verfahren zur sprecherunabhdngigen Spracherkennuhg unter 
Verwendung eines nach einem der Anspruche 7 bis 11 aufgebau- 
ten digitalen Worterbuchs- 

20. 13/ Verfahren nach Anspruch 12, 

- bei dem ein von einem Benutzer gesprochenes . digitalisierte 
Sprachsignal in eine beliebige Anzahl von digitalen Sprachsi- 
gnalteilen aufgeteilt wird/ 

- bei dem aus den digitalisierten Sprachsignalteilen eine 

25 Folge von Merkmalsvektoren gebildet wird, durch die das digi- 
talisierte Sprachsignal charakterisiert wird, 

- bei dem anhand der Merkmalsvektoren im Merkmalsraiim eine 
Folge von Phonemen ermittelt wird, die der Folge von Merk- 
malsvektoren bezuglich eines AhnlichkeitsmaSes am ahnlichsten 

30 ist, 

- bei dem sich ein erkanntes Wort ergibt aus der Folge von 
Phonemen . 
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